[한글 업무 자동화] 단어와 형태소 분석하기

한국어 문장에서 명사, 동사 등 품사들을 추출할 수 있는 기본 말뭉치 툴의 사용법입니다. 파이썬을 이용하며 konlpy(코엔엘파이) 패키지를 활용합니다.

다음을 그냥 있는 그대로 따라하세요.

1. 깃허브에서 konlpy_test.py를 다운 받는다.

2. 'konlpy 설치'라고 검색하면 많은 페이지가 나옵니다. JDK를 설치하고, 가상환경을 이용하기 때문에 설치가 다소 까다롭습니다. 천천히 따라해보세요. 이미 많은 분들이 설치하셨습니다.(이미지를 클릭하세요.)

My Image

3. 설치가 완료되었면 깃허브에서 다운로드 받은 파일을 열어봅니다.

My Image

4. 명령어는 헌법 조문 중 일부[:100] 명사들(nouns)만 추출하도록 하고, 이춘수의 '꽃'에 대해서는 형태소만 추출하도록 되어 있습니다.

My Image